科研星球

Science | 癌症体细胞非编码突变模式的全基因组分析

2022年4月8日,来自哈佛医学院的Eliezer M. Van Allen团队在Science杂志上发表了一篇题为 Genome-wide analysis of somatic noncoding mutation patterns in cancer 的文章,该团队开发了三种方法的组合用于检测3949名患有19种癌症类型和6.12×107个体细胞突变患者的全基因组中的复发性突变事件,根据事件在基因组中的发生位置自动划分为不同类别。这些发现表明非编码突变与广泛的不同生物过程相关,为建立非编码突变与肿瘤进展的关联性奠定了基础,并能为针对非编码癌症基因组的治疗提供宝贵的意见。


0 (2).png

该团队首先通过以下三个步骤对体细胞突变事件进行全基因组检测和分类(图1),随后对从PCAWG和HMF这两个测序联盟获取19种癌症类型的3949个全基因组中的6.12×107个体细胞突变并进行分析,并检测到编码区中的142个事件(癌基因中的45个和抑癌基因中的97个),调节区中的73个事件(启动子中的49个和增强子中的24个),围绕组织特异性基因的70个事件(即仅在特定癌症类型中表达的70个,例如肝脏中的ALB、前列腺中的KLK3等)和87个“其他”事件(确切作用未明)。紧接着,该团队通过三项系统进行后续分析以评估该方法检测非编码基因组汇总突变事件的能力以及分析结果的合理性。简单来说,包括检查突变事件周围的基因组区域,比较与先前的发现和方法的兼容性,以及分析该方法在检测突变事件的统计能力。


0.png

图1. 全基因组检测癌症基因组测序数据中的体细胞突变事件。


接下来,该团队依次对组织特异性基因突变和表达模式以及启动子和增强子区域的突变事件进行表征。就前者而言,非编码区富含插入缺失突变并在A/T富集的核苷酸环境中累积。突变事件的数量在癌症类型之间差异很大,大多数癌症包含超过100个事件,也有部分癌症少于5个事件。此外,许多含有突变事件的组织特异性基因在来自正常组织的单细胞数据中异质表达,这种可能反映肿瘤起源细胞类型的特征性表达程序或许可以当作潜在标记用于诊断。就后者而言,该团队分别评估了转录因子结合位点、差异表达、直接物理相互作用(即非编码区突变涉及的基因与通过编码区分析确定的驱动基因存在相互作用)以及这些突变事件是否与患者的生存差异存在相关性。


需要注意的是,与调控区域中的大多数突变事件相比,乳腺癌患者中鉴定的XBP1 突变主要在其启动子之外的调控区域中积累。该团队通过CRISPR干扰筛选和荧光素酶报告基因分析验证了它们对基因表达的调节作用。这两种方法表明重要的非编码突变事件可以发生在规范的调控区域之外,说明全基因组方法在非编码基因组的已知和未知元件中捕获体细胞突变事件的潜力,此外,还确定了乳腺癌患者中观察到的这种XBP1突变模式与其下游调节区的表达和活性增加有关。


0 (1).png

图2. 检测人类癌症体细胞突变模式的全基因组方法示意图


总的来说,这项研究建立了包含19种主要癌症类型基因组中各种突变模式的全基因组概要。这种全基因组检测方法能够识别整个癌症基因组中的点突变和短插入/缺失事件,而不管它们在基因组中的位置或对蛋白编码序列的影响。这种方法会根据基因组位置自动对突变事件进行分类,从而捕捉它们代表可能驱动突变或乘客突变的不同倾向。这些发现加深了对除编码区以外的98%基因组的突变事件的理解,也为将非编码突变事件进行转化研究和治疗开发提供了见解。


原文链接:

https://doi.org/10.1126/science.abg5601



没有账号?